互联网公司的算法真那么神吗?
这是数字经济的第四篇。
在互联网行业,尤其是投资人圈里,算法已经成了一种迷信,好像无论做什么,只要有了算法就像是吃了“神药”一样,干什么都行,甚至都能飞升了。
有意无意的,整个社会也都信了,程序员们也觉得自己写的程序决定着一家公司的未来,甚至拿着一个APP、一段程序就可以去拉投资,反正“算法”就是一切。
有的公司也各种渲染自己的精准算法有多么厉害,广告推送多么有效,还把算法当做自己的核心竞争力。甚至当美国人逼迫某个公司出售海外业务时,网络上也在流传一个说法:美国人看上了这家公司的精准推送算法,强迫收购这家公司,就是为了拿到“神”一样的算法,这样美国就无敌了,云云。
其实挺可笑的,说到底,全是利益。
为什么吹捧“算法”而不是“数据”,道理很简单。
第一,所有权问题。
正如小镇在《为什么中国支持全球统一税?》一文提到的,数字经济最核心的基础性问题就是数据产权问题,这个问题到现在仍然没有定论,欧洲那些所谓的定论根本就是因循守旧、因噎废食,我们不可能照搬。
先不说更大的领域,单说互联网。比如我们去刷视频、网购、在线支付,这都会产生大量的数据,这个数据参与方太多了,有平台、用户、商家,为了完成数据的交互还需要更多的参与者,比如说通讯商。
那这个数据到底属于谁?企业?用户?商家?亦或者归属于国家或者全民?
可以说,谁有了所有权,谁就掌握了收益分配的优先权和正当性。
但是数据产权一时半会根本说不清。互联网企业非常清楚数据有多大的价值,但是又有谁敢站出来公开说数据归公司所有?不要说在中国,就算在美国、欧洲,敢这么干就等着被社会骂死吧。
无论说破天去,用户作为一个人,也一定享有数据的起码部分所有权,霸王条款终归要受到合法性质疑的,企业是不好直接拿数据换钱的,无论这个钱来自于运营优化、还是吸引更多投资。
已经有现成的例子,今年曾有一波舆论,当时阿里受到质疑,被怀疑拿“蚂蚁森林”减碳额度去换钱,让阿里非常狼狈,好不容易才解释清楚阿里并没有去贩卖碳减排额度。这背后的故事不去讨论。
为什么会被质疑呢?因为“蚂蚁森林”虽然是阿里掏的钱,但却是阿里的用户通过自身绿色行动积累额度,然后换来的,阿里的用户都把这些树视为自己的心血,当听到自己的心血被拿去卖钱,感情上很难接受。
道理是一样的。
如果某家企业,广告是主要的营收,核心竞争力就是精准推送,那是把精准推送归功于庞大数据积累,还是归功于自己的独有算法呢?
如果归功于数据,那拿着属于用户的数据去换钱,这多少是有问题的,钱赚的也并不理直气壮,就有些一羊两吃了。
只要公司决策人不傻,一定会归功于算法,因为算法是知识产权,是这个公司自己所有的。程序员们也开心,因为可以大大提升自己的薪资水平。
第二,科技含量。
踏踏实实赚钱,远远不如有一个故事,提高估值或者股价然后去获得更多的融资。
就比如罗永浩还钱,也并不是靠直播卖货赚回来的,关键还是资本运作,打造一个模式和招牌后,提高估值,寻求获得投资方注资,这样才能在尽可能短的时间还上欠债。
无论直播卖货有多赚钱,相比资本运作,这都是辛苦钱,起码得有许多年时间的积累才行。
扩大到整个互联网甚至更大的范围,道理是一样的,为什么特斯拉市值这么高?为什么其他造车新势力市值这么高?归根到底是故事很美、未来很可期,关键是有一个不可复制的能力,这个能力最好就是科技。
科技含量高了,故事就好说了,相比苦哈哈赚钱,哪里有融资来钱快呢?
在科技含量上,“算法”要比“数据”听起来含量高多了,毕竟前者听起来就是一个高精尖的东西,后者感觉不过是一个记账的。
第三,难易。
数据是需要积累的,积累的过程并不轻松,这是一个非常需要时间和投入的事情。
就像中国如此重视数字经济,选择做的第一件事就是要推广物联网等新型基础设施,要建设完善的数据搜集、输送、存储能力,这是数字经济的根本。
这是需要大量投入的,不可能闭门造车、拍脑袋获得,也需要时间。
而算法就不同了,完全可以几个人闭门造车,也更有故事性,就算什么都没有也无所谓,说一句“我有算法”,好像就可以超越一切因素。
更何况,崇拜“算法”还能掩盖一些不好公之于众的事情,比如用户隐私保护,比如国家安全等等,具体的就不多说了,今年下半年已经有很多人说过了。
算法和数据,到底谁更重要,早在十几年前就被人说的很明白了。
其中一位是李飞飞,被称为“人工智能女王”,这位可不是刚刚入选最新的“2022年IEEE Fellow”的阿里李飞飞,当然这也是全世界学术科技界最权威的荣誉之一,今年全球一共新增265名学者,其中华人达83人。
李飞飞非常传奇,是美国非常少有的横跨科学、医学、艺术三个领域的院士,大家可以搜索下她的成就。
她主要研究的领域就是人工智能和大数据分析,其中一个非常重要的方向就是:通过深度学习让计算机能够看得见我们的现实世界。
李飞飞的做法并不是一门心思去研究算法,而是花了数年时间,发动全世界近5万人一起标记了近10亿张图片,并且精选了1500万张图片形成了著名的公开数据集“ImageNet”,在全世界进行了一场为期8年的算法竞赛。
从2009年到2017年,全球诸多算法团队不断优化算法,终于在2017年,优胜者对于图片的识别率达到97.3%,超过了人类,并且证明了更庞大的数据可以带来更好的决策。
李飞飞以及她领导组建的“ImageNet”,成了全世界人工智能浪潮的催化剂之一。
然而,即使已经站在人工智能和大数据巅峰的李飞飞,也从来没有吹嘘什么算法,她一直强调的就是数据的重要性。
我们的决策层也看的很清楚,“十四五”规划里新列入的关键生产要素是数据,而不是算法。
正如小镇在《一文读懂,为什么国家如此重视数据》里所讲的,数据一直存在,但仿佛宇宙中的暗物质一样,我们无法直接获得,我们现在做的很多事、开发的很多技术,就是为了感知到这些数据,储存并且利用。
搞清楚算法和数据,谁轻谁重的问题,也就能够更好的理解国家关于数字经济的政策了,也就更加能够明白,为什么国家更加看重的是数据,而不是算法。
总之,数据才是一切的根基,算法远比数据更容易提升。就算一时没有更好的数学工具,算法暂时没有创新,但只要数据有了,我们就有了一个宝库,无非是什么时候、用什么更好的方法把宝库里的财宝搬出来而已。
而没有数据的算法,不过是屠龙之术罢了。
其他文章推荐